**Code to generate the results in Figure 1

clear 
cd C:\Users\luciene.pereira\OneDrive\Censo_Mac_2022_05_06\Censo00
use Census_00

*-------------------------------Location Variables------------------------------

*Generating location variables
gen urban = [sit_setor_C == 1]
gen rural = [sit_setor_C == 0]
gen slum = [sit_setor_C == 1 & subnormal==1]
gen city = [sit_setor_C == 1 & subnormal==0]
generate location=0
replace location =1 if rural==1
replace location =2 if slum==1
replace location =3 if city==1

*----------------------------Educational Variables------------------------------

* School attendance for age groups 7-10 and 11-14 years old
gen freq710 =.
replace freq710 = freq_escola if idade >= 7 & idade <=10 

gen freq1114 =.
replace freq1114 = freq_escola if idade >= 11 & idade <= 14 

gen freq =.
replace freq = freq_escola if idade >= 7 & idade <=14

* School lag for age groups 7-10 and 11-14 years old
gen dsi710 =.
replace dsi710 = idade - anos_estudoB -7 if idade >= 7 & idade <=10 

gen dsi1114 =.
replace dsi1114 = idade - anos_estudoB -7 if idade >= 11 & idade <= 14 

gen dsi =.
replace dsi = idade - anos_estudoB -7 if idade >= 7 & idade <=14


* Mother's years of schooling
gen var1 = cond(sexo == 0 & (cond_fam == 1 | cond_fam==2), anos_estudoB,0)

bysort id_dom : egen vari1 = max(var1)

* Father's years of schooling
gen var2 = cond(sexo == 1 & (cond_fam == 1 | cond_fam == 2), anos_estudoB, 0)

bysort id_dom : egen vari2 = max(var2)

*Creating a categorical variable for mother's education
gen educ_mom = .

replace educ_mom = 1 if vari1==0

replace educ_mom = 2 if vari1>=1 & vari1<=4

replace educ_mom = 3 if vari1>=5 & vari1<=8

replace educ_mom = 4 if vari1>=9 & vari1<=11

replace educ_mom = 5 if vari1>=12

*Creating a categorical variable for father's education
gen educ_dad = .

replace educ_dad = 1 if vari2==0

replace educ_dad = 2 if vari2>=1 & vari2<=4

replace educ_dad = 3 if vari2>=5 & vari2<=8

replace educ_dad = 4 if vari2>=9 & vari2<=11

replace educ_dad = 5 if vari2>=12


*-----------------------------Computing the means-------------------------------

* Compute the average of school attendance by parental education (mom) for each location
mean freq [iw=peso_pess] if rural==1 & educ_mom==1
mean freq [iw=peso_pess] if rural==1 & educ_mom==2
mean freq [iw=peso_pess] if rural==1 & educ_mom==3
mean freq [iw=peso_pess] if rural==1 & educ_mom==4
mean freq [iw=peso_pess] if rural==1 & educ_mom==5

mean freq [iw=peso_pess] if slum==1 & educ_mom==1
mean freq [iw=peso_pess] if slum==1 & educ_mom==2
mean freq [iw=peso_pess] if slum==1 & educ_mom==3
mean freq [iw=peso_pess] if slum==1 & educ_mom==4
mean freq [iw=peso_pess] if slum==1 & educ_mom==5

mean freq [iw=peso_pess] if city==1 & educ_mom==1
mean freq [iw=peso_pess] if city==1 & educ_mom==2
mean freq [iw=peso_pess] if city==1 & educ_mom==3
mean freq [iw=peso_pess] if city==1 & educ_mom==4
mean freq [iw=peso_pess] if city==1 & educ_mom==5


* Compute the average of school lag (years behind in school) by parental education (mom) for each location
mean dsi [iw=peso_pess] if rural==1 & educ_mom==1
mean dsi [iw=peso_pess] if rural==1 & educ_mom==2
mean dsi [iw=peso_pess] if rural==1 & educ_mom==3
mean dsi [iw=peso_pess] if rural==1 & educ_mom==4
mean dsi [iw=peso_pess] if rural==1 & educ_mom==5

mean dsi [iw=peso_pess] if slum==1 & educ_mom==1
mean dsi [iw=peso_pess] if slum==1 & educ_mom==2
mean dsi [iw=peso_pess] if slum==1 & educ_mom==3
mean dsi [iw=peso_pess] if slum==1 & educ_mom==4
mean dsi [iw=peso_pess] if slum==1 & educ_mom==5

mean dsi [iw=peso_pess] if city==1 & educ_mom==1
mean dsi [iw=peso_pess] if city==1 & educ_mom==2
mean dsi [iw=peso_pess] if city==1 & educ_mom==3
mean dsi [iw=peso_pess] if city==1 & educ_mom==4
mean dsi [iw=peso_pess] if city==1 & educ_mom==5


		
		
		
	



